演讲

CES 2025 — Project DIGITS 与 Cosmos

开场:AI 进入"物理 AI"时代

在拉斯维加斯 6000 多名观众面前,黄仁勋用 90 分钟铺开了 NVIDIA 在 2025 年的主线叙事:"AI 正在以惊人的速度前进。它始于感知 AI——理解图像、文字和声音;接着是生成式 AI——创造文字、图像和声音。而现在,我们正进入物理 AI 的时代——一个能够感知、推理、规划并行动的 AI。"

他把 NVIDIA 三十年的历程又讲了一遍。1999 年 NVIDIA 发明可编程 GPU;"从那时起,现代 AI 从根本上改变了计算的方式。过去 12 年,技术栈的每一层都被彻底改写——这是一场不可思议的转变。"

CES 2025 的几条主线被他一次性摊开:
- Cosmos:世界基础模型平台,用于推动机器人、自动驾驶和视觉 AI 的物理 AI 发展。
- GeForce Blackwell RTX 50 系列:Blackwell 架构下放到消费显卡。
- 给 RTX PC 的 AI 基础模型:配合 NIM 微服务和 AI Blueprints,造数字人、播客、图像和视频。
- Project DIGITS:把 Grace Blackwell 塞进每一位开发者的桌面。
- 与丰田合作:用 NVIDIA Drive AGX 打造下一代安全的车内计算平台。

GeForce 回到了家:RTX 5090 与 DLSS 4

"GeForce 让 AI 走进了大众,而今天,AI 又回到了 GeForce。" 这句话是他这些年反复讲的一个闭环叙事的精炼版本——GeForce → CUDA → 深度学习革命 → 再反哺图形——在 CES 2025 被他正式用来介绍 RTX 50 系列。

他把一块漆黑的 RTX 5090 高高举起:"就是它,我们全新的 GeForce RTX 50 系列,Blackwell 架构。这颗 GPU 简直是头野兽。" 920 亿晶体管、3352 TOPS 的 AI 算力、两把散热风扇。"连机械设计都是个奇迹。"

但真正的重点不在晶体管数量,而是 DLSS 4 带来的 Multi Frame Generation。"新一代 DLSS 每渲染一帧,能额外生成三帧。所以我们能以不可思议的性能跑游戏——因为 AI 替代了大量的计算。" 这是他在 GTC 2025 重述的"每数学渲染 1 个像素,AI 推理另外 15 个"的消费级开端。

配套发布:RTX Neural Shaders(用小神经网络改进纹理、材质与光照)、RTX Neural Faces(用生成式 AI 渲染真实数字人脸和头发)、RTX Mega Geometry(光追三角形数量提升 100 倍)、Reflex 2(延迟降低 75%)。"AI PC 即将走进你家附近。"

Cosmos:给物理 AI 的 ChatGPT 时刻铺路

如果说 GTC 2024 的主题是大语言模型的工业化生产,那么 CES 2025 的真正重磅是 Cosmos——一个世界基础模型平台。

"物理 AI 是 AI 的下一个前沿。" 黄仁勋把这一刻类比成大语言模型对生成式 AI 的影响:"机器人的 ChatGPT 时刻,就在眼前。"

但困难是现实的:世界基础模型——就像大语言模型对于文本世界一样,是机器人和自动驾驶的起点——然而很多开发者既没有资源、也没有专业能力从零训练。"所以我们把 Cosmos 开源。"

Cosmos 把生成式模型、tokenizer 和视频处理 pipeline 整合在一起;它能处理文本、图像和视频 prompt,生成为机器人和自动驾驶定制的虚拟环境;它能预测和评估多种未来场景,帮助 AI 在行动前选择最佳方案。最关键的一点是:它把算力变成了数据

"过去训练自动驾驶要在真实世界里开车,成本极其高昂,而且长尾情况永远不够。用 Cosmos,我们可以把几百次真实驾驶扩展成数十亿的有效英里。"(数据中心即计算机 的延伸——数据也开始在数据中心里生产)

首批采用 Cosmos 的客户名单本身就是一份"物理 AI 地图":1X、Figure AI、Agility、Neura Robotics、Skild AI、Waabi、XPENG、Uber……横跨人形机器人、自动驾驶和共享出行。Cosmos 以开放许可证发布、在 GitHub 上可以直接下载

自动驾驶:三台计算机与 Toyota 合作

"自动驾驶革命已经来了。" 他把自动驾驶类比成任何机器人都需要的"三台计算机"框架:
- 训练DGX 超级计算机训练 AI 模型。
- 仿真NVIDIA Omniverse 做试驾、生成合成数据。
- 车内:NVIDIA Drive AGX——车里的超级计算机。

这个三台计算机的叙事是他反复在讲的一个方法论——每一个物理 AI 系统都是同构的,关键不是任何一台机器本身,而是这个闭环的完整性。

他宣布了两件大事:
1. Drive Hyperion 平台——首个端到端的自动驾驶平台,整合先进 SoC、传感器和安全系统。奔驰、捷豹路虎、沃尔沃已经采用。
2. 与丰田的合作——世界最大汽车制造商的下一代汽车,将搭载 NVIDIA Drive AGX Orin 并运行通过安全认证的 DriveOS。

在这里他强调了一个容易被忽略的点:合成数据的价值。"真实世界数据是有限的;合成数据是训练自动驾驶数据工厂的关键。我们会拥有一座座训练数据的大山。" Omniverse + Cosmos 的组合正是让这座山可以被凭空造出来的工厂。

"就像计算机图形学的进步速度是惊人的,你会看到未来几年 AV 的发展速度也会急剧加快。"

Agentic AI:企业工作流的下一代

黄仁勋把企业 AI 的下一阶段称为 Agentic AI——能够推理、查资料、使用工具、规划和模拟的 AI 代理。

他宣布了一组 AI Blueprints for agentic AI:PDF-to-podcast(高效研究)、视频搜索和摘要(分析大量视频和图像)。这些 Blueprint 集成了 NVIDIA AI Enterprise 软件栈(NIM + NeMo),并与 CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases 等主流 agent 框架配合。

同时发布 Llama Nemotron——一套用于企业生成式 AI 的增强模型,以 NIM 微服务形式交付,可以在任何加速系统上加速 AI agent。"开发者可以用这些微服务构建客户支持、欺诈检测、供应链优化等场景的 AI agent。"

这里藏着一个更大的判断:未来的企业应用不再是 Excel 里的一堆方格、也不再是 command line——"Agent 系统就是你的 UI。你和平台交互的方式会变得像和人交互一样简单。"

Isaac GR00T Blueprint:给人形机器人造运动数据

"我们谈了这么多 AI 落地的前提技术——它们都会让我们在未来几年看到通用机器人领域非常快速、非常惊人的突破。"

为了让这个突破发生,核心瓶颈仍然是数据。真实机器人演示数据太慢、太贵、太少。

于是他发布 NVIDIA Isaac GR00T Blueprint——一个用于合成运动数据生成的 Blueprint。开发者可以用它生成指数级扩大的人形机器人运动数据,通过模仿学习训练自己的人形机器人。

"在制造业,Omniverse 能为人形机器人生成数以百万计的合成运动数据。" 再往上一层是 Mega Blueprint——用于大规模仿真整支机器人舰队的工作流,帮助像 Accenture 和 KION 这样的公司重新设计仓储自动化。

这三个 Blueprint(物理 AI 的 Cosmos、自动驾驶的 Alpamayo/Drive、机器人的 GR00T)共用同一套哲学:用数据中心里的仿真和生成,去代替物理世界里昂贵的试错

Project DIGITS:把 Grace Blackwell 放到每一张桌子上

"最后,我有一样东西想给你们看。" 这句话之后,他端出了那天最被记住的产品——Project DIGITS

"这些之所以能实现,完全是因为我们十年前启动的一个项目。在公司内部,它叫 Project DIGITS——Deep Learning GPU Intelligence Training System。" 他借此把整个故事往回拉:2016 年,他亲手把第一台 DGX 送到 OpenAI。"那台机器彻底改写了人工智能的计算方式。"

然后他给出了那句最打动开发者的宣言:"未来,每一个软件工程师、每一个工程师、每一个创意艺术家——每一个把计算机当作工具的人,都会需要一台 AI 超级计算机。"

Project DIGITS 就是为此而生。它由 GB10 Grace Blackwell Superchip 驱动,是 NVIDIA 最小但也最强的 AI 超级计算机。"这台机器运行整个 NVIDIA AI 软件栈——所有的 NVIDIA 软件都能在它上面跑,连 DGX Cloud 都能。"

它的意义不只是一台更快的工作站。它是一个信号:AI 算力从集中在云端的巨型工厂,开始向个人桌面回流。GeForce 把 CUDA 送到全世界的开发者手里,而 Project DIGITS 是在 AI 时代做同样的事情——把一台完整的 Grace Blackwell 小型超算,塞进每一位开发者的手边。Project DIGITS 将在 5 月发布。

后来有一段被剪掉的 B-roll 里,黄仁勋对着镜头笑着说:"世界上最强大的 AI 超级计算机,你可以把它插在我的烤面包机旁边的插座上。"

谢幕:一年的突破

"这真是不可思议的一年。" 黄仁勋在收尾时把一年里的里程碑捋了一遍——Blackwell 系统全面铺开、物理 AI 基础模型诞生、agentic AI 和机器人取得突破。"每一层——底层的芯片、中间的基础设施、模型、应用——都在被重新发明。"

他最后再次强调 CES 2025 的主题不是"一款新产品",而是"两场同时发生的平台切换":"应用将建在 AI 之上,你不再是编写软件、而是训练软件;你不再在 CPU 上运行它,而是在 GPU 上运行它。过去的应用是预录制、预编译的;未来的应用是理解上下文、每一次都从头生成每一个像素、每一个 token。"

"这就是为什么过去十年大约 10 万亿美元的计算正在被现代化,为什么每年几千亿美元的 VC 资金涌入这个新世界,为什么 100 万亿美元的产业正在把研发预算从传统方法转向人工智能方法。有人问:'钱从哪里来?'——就是从这里来的。"

"感谢大家的合作。"


原文出处:NVIDIA 官方 wrap-up(blogs.nvidia.com/blog/ces-2025-jensen-huang/)